- Дипломы
- Курсовые
- Рефераты
- Отчеты по практике
- Диссертации
Постановка цели исследования и представление исходных данных в SPSS
Кластерный анализ производится с целью выделения однородных групп (кластеров) из исследуемой совокупности объектов (потребителей, продуктов, брендов и т.п.). Формируемые группы (кластеры) должны быть однородными (гомогенными) внутри и разнородными (гетерогенными) по отношению друг к другу по заданным характеристикам. Например, из всей СОВОКУПНОСТИ туристов, отдыхающих в курортной зоне «Баварский лес», требуется выделить группы, однородные по возрасту и интересам (мотивам проведения времени на отдыхе). Для анализа используется выборка в размере 6396 человек. Следовательно, в проведении кластерного анапиза участвуют 6396 объектов и две переменные, по которым будет производиться разделение объектов на однородные группы (кластеры): возраст и интересы (мотивы проведения времени на отдыхе) туристов (табл. 6.1). Таблица 6.1 № п/п Объекты исследования (туристы) Характеристики объектов (переменные, по которым производится разделение на кластеры) Возраст Интересы (мотивы поведения) 1 2 6396 Турист № 1 Турист N2 2 • • • Турист № 6396 • В ходе факторного анализа (см. предыдущий раздел) были выделены 4 группы интересов (4 мотива поведения) туристов: «Развлечения», «Специальные предложения Восточной Баварии», «Спокойный отдых» и «Спорт». Каждая из перечисленных групп интересов представлена в базе данных как самостоятельная переменная (см. рис. 5.13 и 5.14). Это означает, что каждый турист во время отдыха руководствуется не каким-то одним из четырех мотивов поведения, а всеми сразу. Различия между туристами состоят лишь в том, что перечисленные интересы (мотивы поведения) важны для каждого в разной степени. Следовательно, в ходе кластерного анализа следует выделить группы туристов, однородные по возрасту и по структуре их интересов. Поскольку характеристика «интересы туристов» является множественной переменной, т.е. в базе данных она представлена в виде 4 переменных, то исходный массив данных (см. табл. 6.1) является трехмерным. Метод кластерного анализа позволяет обрабатывать лишь двухмерные массивы данных (объекты и их характеристики). Для того чтобы проведение кластерного анализа стало возможным, необходимо преобразовать структуру исходного массива данных (табл. 6.2). Преобразованная структура исходного массива данных для проведения кластерного анализа N9 п/п Объекты исследования (возрастные группы туристов) Интересы туристов (переменные, по которым производится разделение на кластеры) Развлечения Специальные предложения Восточной Баварии Спокойный отдых Спорт 1 17-18 лет 2 19-24 года 3 25-29 лет 4 30-34 года • • • 11 65-70 лет В табл. 6.2 вносятся оценки туристами степени, в какой они руководствуются теми или иными интересами при проведении времени на отдыхе. Данные оценки являются средними по каждой возрастной ipynne. 113 Разделение возрастных групп на категории (например, от 25 до 29 лет) было произведено в целях сокращения числа объектов исследования. В проведении исследований участвовали туристы в возрасте от 17 до 70 лет. Если бы в качестве объектов исследования были взяты возрастные группы, объединяющие только туристов определенного возраста (например, 17 лет, 18 лет... 44 года и т.д.), то число объектов исследования составило бы 63 (70 - 17). Лкое большое число объектов исследования существенно затрудняет интерпретацию результатов кластерного анализа. Разделение возрастных групп на категории привело к сокращению числа объектов исследования (возрастных групп туристов) с 63 до 11. Иллюстрация постановки цели кластерного анализа в нашем примере представлена на рис. 6.1. Для проведения кластерного анализа в SPSS создается новый файл данных (рис. 6.2 и 6.3). На рис. 6.2 представлен фрагмент исходного файла данных, состоящего из 5 переменных. Первая переменная с именем «Age» и меткой «Возрастные группы» является текстовой переменной, об этом есть соответствующая запись (String) в столбце «Туре». Со значениями этой переменной нельзя будет производить никаких арифметических операций. Четыре переменные с именами «FAC1_1», «FAC2_1», «FAC3 J» и «FAC4_1» являются компонентами факторной модели, построенной в результате проведения факторного анализа (см. предыдущий раздел). Значения этих переменных представляют собой усредненные балльные оценки важности для турисюв каждой возрастной группы следующих интересов: «Развлечения», «Специальные предложения Восточной Баварии», «Спокойный отдых» и «Спорт» (рис. 6,3). Как было описано в предыдущем подразделе, при проведении опроса респондентам предла1алось оценить 12 мотивов проведения времени на отдыхе по 5-балльной шкале («1» — «очень важно» и «5» — «совсем не важно»). В результате проведения факторного анализа 12 переменных исходного массива данных были сгруппированы в 4 переменные, в ходе проведения анализа произошла трансформация значений переменных. Средняя оценка (3) была приравнена к нулю. Именно поэтому средние значения оценки значения для туристов четырех мотивов поведения, представленные на рис.
Каталог работ |
Похожие рефераты:
- Постановка цели исследования и представление исходных данных в SPSS
- Постановка цели исследования и представление исходных данных в SPSS
- Постановка цели исследования и представление исходных данных в SPSS
- Постановка цели исследования и представление данных
- Постановка цели исследования и представление данных